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摘 要 : 


[ 目的 /意义 ] 信 息 技术 的 快速 发 展 与 广泛 应 用 推动 了 敦煌 学 研究 的 变革 ,使 敦煌 学 研究 及 其 知识 资源 的 利用 更 加 


便利 ,由 于 还 停留 在 现 有 数据 库 传统 知识 平台 与 检索 方式 上 ,使 敦煌 遗书 图 像 知 识 的 价值 挖掘 不 全 面 。 为 此 , 笔 
者 对 敦煌 遗书 图 像 研究 进行 梳理 ,对 敦煌 图 像 知识 发 现 的 深度 和 广度 及 其 知识 关联 进行 充分 的 语义 描述 ,以 利于 
发 气 敦 煌 遗书 图 像 的 多 元 价值 。[ 方 法 /过 程 ] 通 过 敦煌 遗书 图 像 研究 现状 的 考量 、 语 义 描述 ,根据 敦煌 和 遗书 图 像 
语义 特征 设计 其 语义 特征 层级 模型 ,结合 智能 + 关联 数据 技术 构建 敦煌 遗书 图 像 知 识 关 联 的 组 织 框架 ,并 深入 分 
析 了 敦煌 遗书 图 像 知识 关联 及 其 组 织 框架 中 的 数据 收集 层 、 语 义 描述 层 、 数 据 关 联 层 、 资 源 应 用 层 。[ 结果 /结论 ] 


量 以 及 提升 敦煌 遗书 图 像 知 识 服务 的 深度 与 广度 。 
词 : 关联 数据 敦煌 遗书 图 像 ”语义 特征 层级 模型 
号 : G254 


提出 敦煌 遗书 知识 关联 模型 的 实践 价值 ,能 够 打通 与 外 部 开放 数据 关联 渠道 ,提高 敦煌 遗书 图 像 智能 化 的 检索 质 


2 相关 研究 


遗书 图 像 是 中 国 乃至 世界 的 珍贵 文化 遗产 ， 
丰富 的 语义 内 涵 , 对 于 研究 中 国 古代 社会 
历 更 .美术 与 宗教 文化 等 具有 重要 意义 。 当 前 ,数据库 


相关 研究 围绕 敦煌 遗书 图 像 知 识 语义 分 析 、 关 联 
数据 及 图 像 资源 组 织 等 方面 展开 讨论 。 敦 煜 遗书 中 藏 
有 人 物 画 动物 画 、 植 物 画 等 大 量 不 同类 型 和 风格 的 绘 


的 传统 知识 平台 与 检索 方式 多 是 对 图 像 资 源 进行 简单 
的 沪 录 ,限制 敦煌 遗书 图 像 知识 的 利用 效果 与 知识 发 


现 深度 ,无 法 挖掘 图 像 资 源 的 最 大 价值 颗粒 度 , 难 以 满 
让 者 户 的 检索 需求 。2006 年 7 月 ,万 维 网 之 父 蒂 姆 : 
伯 纳 斯 李 (T.，Berers-Lee) 在 《关联 数据 笔记 》9 
先 提出 关联 数据 这 一 全 新 概念 ,关联 数据 要 求 采用 
RDF 格式 描述 资源 ,利用 URI 标识 和 命名 资源 实体 ， 
并 建立 能 够 被 万 维 网 解析 的 HTTP URI 帮助 用 户 查 找 
与 获取 相关 资源 和 数据 " , 它 可 将 跨 来 源 . 跨 类 型 的 数 
据 进 行 关联 ,实现 知识 的 有 序 化 和 共享 ”。 将 关联 数 
据 应 用 于 敦煌 遗书 图 像 知 识 组 织 有 利于 对 凌乱 分 散 的 
图 像 资源 进行 高 效 整理 ,实现 图 像 资源 与 其 他 相关 解 
读 文 本 或 视频 在 知识 层面 上 的 关联 ,为 敦煌 遗书 图 像 
的 价值 发 掘 与 有 效 利用 提供 组 织 层面 的 保障 。 


曙 
ANz| 


画作 品 ,诸多 学 者 从 不 同 角度 对 这 些 绘画 作品 的 方 方 
面 面 进行 细致 探究 ,为 后 世 继 续 探索 敦煌 遗书 图 像 留 
下 参考 价值 高 的 文献 资料 ,对 敦煌 遗书 图 像 进行 语义 
特征 分 析 是 后 续 开 展 语义 描述 .知识 关联 等 深度 探究 
工作 的 前 提 。 图 像 语义 描述 模型 与 相关 的 敦煌 项 目 语 
义 知 识 组 织 等 研究 对 敦煌 遗书 图 像 语义 描述 与 组 织 模 
式 构 建 具有 借鉴 作用 。 
2.1 敦煌 学 相关 平台 、 数 据 库 建设 

敦煌 遗书 图 像 数 字 化 是 后 续 开 展 图 像 资 源 语义 特 
征 分 析 、 本 体 构建 语义 互联 以 及 语义 检索 等 深度 探究 
工作 的 前 提 。 当 前 ,国内 外 启动 多 项 敦煌 学 数字 化 项 
目 ,如 多 国共 同 合作 的 国际 敦煌 项 目 (International 
Dunhuang Project IDP)” 、 敦 煌 遗书 数据 库 ” 敦煌 文 
献 数 字 图 书馆 “ 等。 笔者 通过 对 这 些 项 目 ,数据库 . 平 
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台 建设 的 调研 可 知 , 它 们 的 许多 功能 也 看 待 完善 ,而 关 
联 数据 的 应 用 可 以 实现 目前 诸多 敦煌 数据 库 不 够 完善 
的 功能 。 
2.2 ”关联 数据 与 知识 资源 研究 

关联 数据 的 突出 优势 就 是 能 够 将 分 散 、 异 构 跨 界 
的 数据 进行 链接 ,支持 不 同 知识 层面 资源 的 聚合 .共享 
与 发 现 。 关 联 数据 不 仅 突破 传统 文本 知识 组 织 方式 ， 
还 涉及 图 像 研究 领域 。 曾 子 明 等 根据 用 户 需求 提出 基 
于 关联 数据 的 视觉 资源 知识 组 织 模型 ,构建 数字 人 文 
视觉 资源 语义 本 体 模型 并 以 敦煌 学 中 的 “ 鸠 摩 罗 什 ? 
形象 进行 实例 论证 ; 张 兴旺 等 归纳 非 物 质 文化 遗产 
图 像 .视频 等 资源 数字 化 保存 的 不 足 之 处 ,提供 相应 的 
非 遗 视觉 资源 的 获取 、 组 织 和 描述 方法 ” ; 齐 云 飞 等 以 
数字 图 书馆 中 存储 的 静态 图 像 即 图 片 为 研究 对 象 , 采 
用 袜 联 数据 技术 ,参考 新 一 代 编目 方式 一 书目 框架 
(BFRAME ) 构 建 数字 图 书馆 移动 视觉 搜索 系统 框架 
并 器 行 验证 ; 张 永 娟 等 以 印章 图 像 为 例 ,尝试 运用 
I 与 关联 数据 等 技术 探索 图 像 元 数据 描述 .图像 描 
述 卉 容 的 知识 组 织 .关联 数据 发 布 等 图 像 资 源 整 合 与 
条 ER 发 现 的 解决 方案 并 进行 实证 分 析 "” 。 
2 及 图像 语义 描述 研究 
中 图 像 语义 描述 研究 主要 集中 在 语义 标注 模型 . 语 
这 襄 注 工具 .语义 检索 系统 设计 等 方面 。 陆 泉 等 通过 
用 扩 实 验 数据 对 比 基 于 标签 打分 的 图 像 标注 模式 , 音 
栋 矣 下 基于 图 像 比 较 的 标注 模式 与 多 标签 下 基于 图 像 
比 轿 的 标注 模式 等 三 种 模式 的 标注 效果 "" ; 陈 金 菊 等 
从 语义 层次 .可 扩展 性 、 应 用 范围 和 方式 三 个 方面 对 
Eakins 模型 Jaimes&Chang 模型 Kong 模型 这 三 类 主流 
图 像 语义 标注 模式 进行 比较 分 析 "" ; 陈 金 菊 归 纳 总 结 
已 经 开发 的 几 种 图 像 语义 标注 工具 并 从 10 个 关键 特 
性 对 比 三 类 工具 '” ; 张 志 武 基于 本 体 标 注 web 图 像 的 
局 性 概念 及 图 像 之 间 的 相互 关系 ,构建 包含 图 像 领域 
本 体 、 图 像 本 体 库 与 以 前 两 者 为 基础 提供 的 检索 服务 
这 三 大 部 分 的 Web 图 像 语义 检索 系统 。 
2.4 ”敦煌 遗书 图 像 与 知识 组 织 研究 

敦煌 遗书 图 像 领域 的 研究 聚焦 于 图 像 内 容 图像 
隐 射 的 历史 文化 等 方面 ,而 与 敦煌 遗书 图 像 关系 密切 
的 敦煌 壁画 研究 不 局 限于 壁画 本 身 内 容 , 往 往 涉及 计 
算 机 、 图 书 情报 等 多 个 领域 。 王 晓 光 等 根据 用 户 的 图 像 
检索 需求 ,提出 针对 敦煌 壁画 的 数字 图 像 语义 描述 框架 
以 此 解决 数字 图 像 元 数据 无 法 准确 揭示 壁画 图 像 内 容 
及 语义 信息 的 问题 "9 ; 宋 志 浩 对 比分 析 基 于 文本 、 内 容 
和 语义 的 三 种 检索 方式 ,设计 出 基于 本 体 的 敦煌 壁画 语 


义 系统 的 实现 方案 并 尝试 在 系统 中 运用 全 文 检索 技术 
以 此 帮助 科研 人 员 迅 速 检 出 目标 壁画 及 其 相关 研究 文 
献 ' ;王晓光 等 在 构建 敦煌 壁画 叙 词 表 的 基础 上 采用 语 
义 网 技术 实现 氢 词 表 关联 数据 的 发 布 "” 。 

2.5 ”敦煌 遗书 图 像 与 知识 关联 研究 

自 敦煌 藏 经 洞 被 发 现 后 ,各 国学 者 对 敦煌 遗书 所 
存 图 像 的 相关 问题 进行 广泛 探索 。 在 图 像 内 容 研究 方 
面 ,日 本 学 者 松本 荣 一 对 流散 在 各 国 各 地 的 敦煌 绘画 
进行 长 期 调查 和 研究 并 著 写 《敦煌 画 的 研究 》, 他 利用 
佛学 知识 对 敦煌 藏 经 洞 出 土 的 绘画 作品 进行 考释 、 定 
名 以 及 分 类 , 沙 武 田 、 印 惠 者 ”、 张 培 君 ”等 分 别 
对 藏 经 洞 出 土 的 白描 画 .敦煌 遗书 中 的 供养 人 图 进行 
专题 介绍 ,分 类 与 评述 ;在 图 像 的 分 类 整理 方面 , 施 萍 
婷 按照 绘画 技法 将 敦煌 遗书 中 的 纸 本 画 分 为 彩绘 五 
彩绘 淡 彩 绘 . 刺 孔 、 白 画 、 白 描 等 类 型 "1 ; 在 敦煌 遗书 
图 像 的 专题 研究 方面 , 戴 仁 将 敦煌 写本 中 的 插图 分 为 
卷首 插图 . 带 状 插 图 、 人 物 画 和 成 文 的 图 像 四 类 ; 艾 
丽 白 把 “涂鸦 ”分 为 人 物 、 动 物 和 植物 三 类 ,其 中 人 物 
又 可 分 为 俗人 宗教 人 士 淫秽 图 画 之 人 物 , 并 罗列 出 
画 有 “涂鸦 ”的 相关 卷 号 ;部 分 学 者 对 敦煌 遗书 中 出 
现 的 人 物 ,如 水 月 观音 、 千 手 千 眼 观音 、 不 空 畦 索 观 音 、 
观音 经 变 等 观音 车 萨 图 像 .地 藏 图 像 . 行 脚 僧 图 ,净土 
图 像 文殊 菩萨 . 毗 沙 门 天 王 图 像 .父母 恩 重 经 变 图 、 瑞 
像 图 、 炽 盛 光 佛 变相 图 等 进行 分 门 别 类 的 横向 研究 。 
此 外 ,部 分 学 者 从 纵向 深入 挖掘 敦煌 遗书 图 像 中 蕴含 
的 内 涵 , 如 杨 树 云 以 英 藏 5.47 为 例 探讨 唐 代 妇 女 妆 
容 !2 ,还 有 学 者 探究 敦煌 绢 纸 绘 画 的 颜料 .性 幢 、 服 
饰 . 花 绘图 案 等 主题 内 容 。 敦 煌 遗书 中 圳 括 数 以 千 计 
的 种 类 丰富 的 图 像 作品 ,众多 不 同 专题 的 图 像 研 究 文 
献 挖 掘 敦煌 遗书 图 像 背后 所 蕴含 的 丰富 知识 ,并 为 其 
他 学 者 开辟 新 的 研究 课题 方向 ,只 有 通过 适合 图 像 的 
著录 、 标 引 、 检 索 方式 并 结合 用 户 需 求 才能 实现 敦煌 遗 
书 图 像 知 识 的 价值 颗粒 度 最 大 化 。 

综 上 ,关联 数据 能 够 将 广泛 分 布 的 异 构 资 源 进行 
关联 组 织 , 虽 多 用 于 文本 资源 ,但 也 有 部 分 学 者 开始 探 
究 关 联 数据 如 何 应 用 于 图 像 资 源 组 织 , 打 破 敦 煌 人 遗书 
相关 数据 库 检 索 与 利用 的 限制 ,为 敦煌 遗书 图 像 知 识 
组 织 模式 建设 提供 理论 框架 。 目 前 敦煌 遗书 图 像 领域 
主要 探索 图 像 内 涵 绘画 技法 等 问题 ,对 敦煌 遗书 图 像 
提供 详细 的 语义 分 析 , 这 是 构建 图 像 资 源 组 织 模式 的 
前 提 , 但 是 关于 图 像 资源 的 语义 描述 与 知识 关联 研究 
较为 匮乏 。 与 敦煌 遗书 图 像 关 系 密切 的 敦煌 壁画 在 数 
字 图 像 语 义 描述 方法 .语义 描述 层次 模型 . 叙 词 表 关 联 
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数据 发 布 等 方面 有 较为 出 色 的 成 果 ,这 便 为 笔者 关于 
如 何 刻画 与 抽取 敦煌 遗书 图 像 的 语义 特征 、 进 行 语义 
描述 .与 关联 数据 相 结合 构建 知识 组 织 模式 提供 借鉴 。 
3 ”敦煌 遗书 图 像 知 识 关 联 的 语义 特征 
敦煌 遗书 是 敦煌 藏 经 洞 传世 文献 的 泛称 (敦煌 遗 
书 绝 大 多 数 为 唐 时 期 写本 , 间 有 五 代 、 北 宋 前 期 写本 ， 
不 仅 如 此 ,还 保持 了 一 些 雕 版 印 本 ,如 P. 3879《 北 方 大 
圣 吡 沙门 天 王 像 荫 雕 印 题记 》) , 又 被 称 为 敦煌 写本 、 
敦煌 卷子 或 敦煌 文书 ,在 国内 外 都 会 被 官方 和 民间 收 
藏 机 构 视 为 绝世 珍宝 ,为 将 敦煌 遗书 的 利用 价值 充分 
挖掘 ,包括 我 国 在 内 的 各 国 相关 机 构 和 学 者 都 在 探索 
数字 化 的 方法 。 王 晓 光 等 对 敦煌 壁画 的 数字 图 像 特征 
撕 述 方面 有 更 加 深入 的 研究 ,他 将 数字 图 像 本 身 的 特 
征 藻 数字 图 像 内 容 特征 区 别 开 来 ,将 数字 图 像 本 身 所 
基 事 的 颜色 纹理 .线条 视 为 图 像 的 底层 视觉 特征 ,将 
Re 


动机 .所 处 的 时 代 背 景 和 地 理 环 境 等 内 容 视 为 高 层 语 
关 奉 达 ” ,这 为 笔者 构建 敦煌 遗书 图 像 知识 的 语义 特 
征明 级 模型 提供 思路 。 数 字 化 时 代 人 们 往往 将 目光 聚 
焦 沁 数字 图 像 , 却 名 视 原始 图 像 的 物理 特征 ,对 这 些 物 
理 丢 征 的 标注 和 描述 有 利于 探究 图 像 形 成 时 期 的 工艺 

发 展 。 敦 煌 遗书 所 保存 的 大 量 图 像 , 其 本 身 具 有 
物理 性 质 ,这 一 物理 性 质 往往 是 附着 于 其 载体 纸 本 之 
级 得 以 体现 ,所 以 在 对 其 进行 语义 特征 描述 时 ,应 该 
包 钦 两 个 层次 :原始 图 像 的 物理 层次 和 经 过 数字 化 扫 
描 之 后 图 像 本 身 所 呈现 出 来 的 视觉 信息 。 物 理 层次 主 
要 涉及 纸张 材质 .尺寸 .颜色 .绘画 技法 以 及 施 彩 用 黑 
等 ,有 些 特例 比如 剪纸 图 像 P. 4517《 持 性 车 萨 像 》( 剪 
纸 ) 见 图 1, 就 可 以 通过 这 一 层次 的 描述 加 以 区 别 ,但 
是 因为 不 具备 相关 条 件 ,这 一 层次 的 语义 描述 暂 不 加 
以 讨论 ,但 车 条 件 允 许 ,还 是 应 该 尽力 列 入 ,以 丰富 语 
义 描 述 的 层次 ,使 之 至 于 完善 。 
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图 2 


1 了 . 4517《《 持 幅 车 萨 像 》( 剪纸 )) 


再 经 过 数字 化 扫描 之 后 ,图 像 所 呈现 出 来 的 视觉 
信息 基本 得 以 比较 完满 的 保存 ,在 对 其 进行 语义 描述 
时 ,也 应 分 为 两 个 层面 :数字 化 图 像 本 身 及 其 所 反映 出 
来 的 相关 内 容 。 正 如 前 文 所 述 ,敦煌 遗书 数字 图 像 本 身 
和 图 像 内 容 存在 着 本 质 的 区 别 ,前 者 主要 包括 映射 敦煌 
遗书 图 像 的 线条 形状 色彩、 纹路 等 视觉 特征 ,后 者 则 
是 对 于 数字 图 像 所 呈现 出 的 图 形 意义 、 事 物 形 态 、 故 事 
内 容 、 人 物 行为 ,其 至 是 人 物 的 情感 状态 等 高 层 语义 特 
征 ,前 者 是 后 者 的 认 知 基础 ,后 者 是 前 者 的 抽象 表述 。 


4 ”敦煌 遗书 图 像 知识 关联 的 语义 描述 


笔者 立足 于 学 术 界 对 敦煌 遗书 图 像 的 检索 需求 ， 
结合 相关 图 像 检索 理论 与 实践 研究 ,借助 图 像 元 数据 
理论 ,将 原始 图 像 的 物理 特征 数字 图 像 自 身 特征 和 数 
字 图 像 内容 特 征 进 行 整合 ,提出 敦 焊 遗书 图 像 的 语义 
特征 层级 模型 ,试图 揭示 图 像 三 个 层次 的 所 有 特征 ,从 
而 满足 科研 人 员 与 普通 用 户 的 检索 需求 并 扩大 敦 焊 遗 
书 图 像 的 知识 发 现 深 度 , 如 图 2 所 示 : 
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敦煌 遗书 图 像 语义 特征 层级 描述 模型 
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在 敦煌 遗书 图 像 的 语义 特征 层级 模型 中 , 左 起 第 
一 部 分 是 物理 层 , 第 二 部 分 是 图 像 视 觉 内 容 特 征 层 , 第 
三 部 分 是 语义 数据 层 。 


数据 检索 ,就 必须 进行 从 粗 至 细 的 分 类 ,而 研究 者 在 进 
行 元 数据 检索 时 ,往往 也 是 遵循 这 一 基本 规律 ,来 实现 
在 不 同 层级 上 的 数据 关联 ,结合 敦 焊 遗书 图 像 的 实际 


关于 物理 层 ,上 文 已 作 简 单 说明 , 不 再 袭 述 。 第 二 
部 分 视觉 内 容 特征 层 主要 是 反映 数字 化 之 后 敦煌 遗书 
图 像 的 视觉 特征 。 很 多 遗书 图 像 在 勾勒 线条 上 有 一 定 
的 规律 性 ,如 宗教 符号 曼 陀 罗 的 线条 分 布 ,所 以 人 物 匀 
惑 的 圆润 技法 也 有 明显 的 特征 ,在 形状 大 小 和 空间 分 布 
受到 载体 制约 趋向 一 致 ,颜色 处 理 也 有 倾向 性 ,因此 通 
过 设计 和 改进 计算 机 图 形 软件 的 统计 功能 ,结合 CBIR 
中 的 SIFT 算法 和 CNN 算法 的 优点 , 既 能 做 到 提取 图 像 
的 局 部 特征 又 能 实现 对 图 像 整体 的 全 局 特征 的 抽取 ,在 
计算 机 中 嵌入 图 像 识别 技术 和 图 像 学 习 技术 ,在 批 处 理 
英 件 的 信息 模块 化 的 数据 收集 基础 上 ,不 断 提 高 其 识别 
能 五 ,最 终 形 成 元 数据 链条 ,并 由 此 实现 基于 特征 的 图 
像 消 容 检 索 ,打通 图 像 数据 关联 的 通道 ,服务 于 用 户 。 

看 义 数 据 层 ( 下文 5.1 节 详 述 ) 是 实现 敦煌 遗书 图 
像 玛 识 检索 利用 的 核心 模块 ,基于 语义 的 检索 本 质 上 
是 就 伯 遗 书 图 像 本 体 的 核心 设计 。 本 体 的 设计 关键 在 
也 和 定 敦煌 遗书 图 像 资 源 中 的 实体 概念 ,因此 如 何 设 
让 妆 据 类 目 是 至 关 重 要 的 步骤 。 王 晓 光 与 多 位 教 伯 
次 如 家 共同 合作 ,融合 敦煌 学 .图像 志 艺术 史 等 不 同 
学 得 的 研究 内 容 和 分 析 方法 ,构建 内 容 详实 .语义 丰富 
的 喜 竹 壁画 主题 词 表 。 教 煌 壁画 主题 词 表 共 分 为 五 大 


kee 


情况 ,可 以 将 语义 检索 的 最 底层 设计 为 图 形 意义 。 所 
请 图 形 意义 , 即 图 像 数 字 化 之 后 呈现 出 的 基本 面貌 和 
表达 含义 ,具体 而 言 ,图 形 意义 又 可 划分 为 图 案 类 、 物 
体 类 ,场景 类 、 人 物 类 等 等 ,这 是 最 基本 的 几 类 特征 ,可 
以 视 为 建立 在 全 面 筛 选 上 的 初步 划分 。 敦 煌 壁画 主题 
词 表 将 动物 和 植物 与 人 物 共同 归纳 为 代理 者 ,笔者 在 
本 节 中 将 动 植物 与 人 类 区 分 开 来 ,因为 敦煌 遗书 图 像 
中 人 类 相 较 于 动 植物 有 更 多 丰富 的 语义 特征 ,如 人 类 
的 头饰 ,服饰 .手势 .表情 等 。 

4.2 事物 形态 

事物 形态 实际 上 是 上 述 特征 分 类 中 相 较 于 场景 类 
和 人 物 类 的 图 案 类 和 物体 类 ,相关 图 像 所 表达 的 含义 
比较 直接 ,所 以 将 此 两 类 合并 于 一 个 层级 。 所 谓 图 案 
类 ,主要 是 宫 括 了 敦煌 遗书 图 像 中 各 类 人 花纹、 符号 、 标 
记 等 等 。 其 中 花纹 中 最 具 代 表 性 的 是 各 种 云 纹 , 见 图 
3 的 BD.13801《 妙 法 莲 华 经 卷 第 一 织锦 护 首 》 卷 首 的 
织锦 部 分 绘制 大 量 精美 的 云 纹 ,不 同 的 云 纹 展 现 出 不 
同 的 形态 ,不仅 起 到 一 定 的 烘托 氛围 的 作用 ,而 且 反映 
唐 代 绘 画 的 精湛 水 平 ,值得 美术 史学 者 深入 研究 ,将 云 
纹 列 为 元 数据 标签 ,收录 于 数据 库 , 以 便 关 联检 索 , 这 
无 疑 将 大 大 便利 相关 研究 的 开展 。 符 号 类 别 里 ,具有 


生硬 ,分 别 为 代理 者 分 面 (AGENT FACET) .时间 分 面 
(TE FACET) .活动 分 面 (ACTIVITIES FACET) 物体 
分 面 (OBJECT FACET) 和 物理 特质 分 面 (PHYSCIAL 


[es 


ATIRIBUTES FACET) 5 。 敦 煌 遗书 图 像 知 识 比较 碎 


片 化 ,不 如 敦煌 壁画 知识 的 连贯 完整 ,但 是 某 些 图 像 内 
容 又 与 敦 烛 壁画 有 着 紧密 联系 , 故 可 选择 该 襄 烛 壁画 
的 主体 词 表 中 的 专业 术语 作为 敦煌 遗书 图 像 本 体 的 实 
体 概 念 。 笔 者 广泛 收集 各 类 敦煌 遗书 影印 文献 数字 化 
资料 ,包括 《法 藏 敦煌 西域 文献 兴 英 藏 敦 煌 文献 兴 北 
京 大 学 藏 敦煌 文献 《中 国 国 家 图 书馆 藏 敦煌 遗书 》 
《甘肃 藏 敦煌 文献 《天 津 市 艺术 博物 馆藏 敦煌 文献 》 
《 俄 藏 敦煌 文献 兴 上 海 图 书馆 藏 敦煌 吐鲁番 文献 》, 并 
对 其 逐一 进行 细致 的 翻 查 , 共 搜集 图 像 类 资料 计 近 干 


曼 陀 罗 风 格 的 图 像 很 多 ,变化 多 端 ,如 附 有 大 量 听 语 的 
P.3679《 只 字 咽 》, 还 有 其 至 夹杂 西域 文字 的 ,如 P. 
4521 就 在 符号 中 夹杂 很 多 回 骸 文 的 字形 ,这 些 特异 的 
图 像 一 旦 通过 关联 形式 全 部 排列 展现 出 来 ,将 会 大 大 
便利 研究 者 的 视野 ,方便 其 进行 深入 研究。 标记 的 情 
况 就 更 为 复杂 ,可 以 进行 更 多 更 细 的 划分 ,在 此 就 不 再 
歼 述 。 除 图 案 类 ,敦煌 遗书 中 还 有 大 量 物体 类 图 像 , 所 
谓 物体 类 ,是 除去 人 物 之 外 的 描绘 客观 物体 的 图 像 , 简 
单 来 说 ,诸如 植物 .动物 精怪、 器具 等 等 。 植 物 类 主要 
是 各 类 树木 和 花 , 因 无 法 细 辩 纲目 科 属 ,在 设计 元 数据 
采集 特征 时 ,只 能 简单 加 以 划分 。 敦 煌 遗书 中 出 现 很 
多 动物 ,如 有 大 量 白 画 马 的 图 像 ,有 的 是 有 一 匹 ,如 P. 
3652 ,有 的 则 是 两 匹 .三 匹 ,如 P.3614, 马 匹 对 于 古代 社 


余 幅 ,在 反复 浏览 的 基础 上 ,依据 其 所 反映 出 的 综合 情 
况 , 抽 取 吾 烛 壁 画 主 题词 表 中 相关 术语 ,结合 学 界 研究 
的 需要 , 暂 分 为 五 个 递 进 层级 :图 形 意 义 、 事 物 形态 、 故 
事 内 容 、 人 物 行为 和 情感 状态 。 
4.1 图 形 意义 

敦煌 遗书 图 像 是 一 个 庞大 的 数据 集合 ,要 实现 元 


会 而 言 可 以 说 是 最 为 重要 的 活动 交通 工具 ,不 仅 载 人 
运输 ,信息 传递 需要 大 量 马匹 ,在 军事 行动 中 马匹 也 是 
最 为 重要 的 战略 资源 ,有 时 候 其 至 起 到 举足轻重 的 作 
用 ,因此 对 其 进行 基于 数据 关联 的 研究 ,将 会 极 大 丰富 
对 于 唐 宋 时 期 马 政情 况 的 了 解 ,意义 非凡 。 除 反映 现 
实生 活 中 的 事物 , 教 焊 遗书 图 像 里 还 描绘 大 量 精 怪 ,如 
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P. 2683《 瑞 应 图 》, 仅 此 一 图 就 保存 将 近 二 十 多 种 神话 
精怪 的 图 像 , 在 对 这 类 图 像 进行 特征 描述 时 ,应 该 尽量 
做 到 细致 ,如 可 对 其 进行 二 次 描述 ,类 免 、 类 鱼 还 是 类 
蛇 , 有 翅 还 是 无 翅 等 等 ,以 便 更 加 精准 有 效 地 采集 元 数 
据 。 这 里 所 指 的 器 具 内 涵 丰 富 ,包括 交通 工具 如 凤 棕 、 
牛 车 、 马 车 ,如 P.3995《 彩 绘 炽 盛 光 佛 一 尊 》 中 炽 盛 光 
佛 所 乘坐 的 交通 工具 便 是 牛 车 ,以 及 军事 工具 、 生 产生 


发 展 及 其 所 折射 出 的 社会 形态 .宗教 历史 具有 极为 重 
要 的 作用 。 对 于 这 类 图 像 ,在 设计 特征 描述 时 ,应 从 两 
方面 着 手 , 即 一 方面 要 准确 完整 地 著录 其 本 经 经 名 , 即 
变相 所 阐释 的 佛经 经 名 ,使 研究 者 能 通过 数据 关联 检 
索 同 一 佛经 的 不 同 变相 ,方便 其 进行 比较 研究 ; 另 一 方 
面 ,也 要 充分 关注 经 变 图 像 的 空间 ,布局 .故事 梗概 等 
图 像 所 传递 出 的 实际 内 容 , 以 反映 其 独立 于 本 经 的 研 


活用 具 和 宗教 使 用 的 器 具 等 等 ,敦煌 遗书 图 像 中 出 现 
的 器 具 一 般 以 宗教 絮 具 为 主 ,如 佛像 .车 防 像 中 佛 与 昔 
陕 所 坐 的 莲花 台 座 ,莲花 固有 出 淤泥 而 不 染 之 意 ,以 此 
象征 自身 远离 尘世 污秽 之 地 。 器 具 往 往 与 人 物 行为 息 
息 相 关 , 因 此 可 以 将 人 物 与 人 物 .器 具 与 器 具 ` 人 物 与 


器 具 相 关联 ,以 此 研究 不 同类 型 的 工具 从 北魏 至 北宋 
的 发 展演 变 。 
> 


图 3 BD.13801《 妙 法 莲 华 经 卷 第 一 织锦 护 首 》 
4.3 故事 内 容 

故事 发 展 往往 与 场景 相 结 合 , 故 而 将 场景 类 定义 
为 故事 内 容 , 从 而 更 加 清晰 直观 。 场 景 包含 环境 ,敦煌 


究 价 值 。 
4.4 ” 人物 类 

敦煌 遗书 图 像 中 最 多 一 类 就 是 人 物 , 人 物 本 身 就 
具有 丰富 的 语义 特征 。 人 物 当 中 尤 以 各 类 著 萨 居多 ， 
车 萨 中 又 以 观音 像 最 多 ,如 P. 3969《 彩 绘 十 一 面 六 辟 
观音 像 》, 对 这 一 类 著 萨 图 像 进行 语义 特征 描述 ,必须 
建立 在 广泛 参考 相关 人 研究 成 果 的 基础 上 ,努力 区 分 车 
萨 图 像 造 型 的 类 别 特征 ,以 期 更 加 科学 地 标注 元 数据 ， 
除 车 萨 之 外 ,有 关 佛 经 的 敦 烛 遗 书 图 像 还 有 一 个 重要 
类 别 就 是 供养 人 ,如 P. 4060《 会 重镇 遏 使 罗 禧 通 供 养 
佛像 》, 在 敦煌 壁画 中 描绘 大 量 供养 人 ,供养 人 图 像 往 
往 有 各 种 不 同 的 行为 举止 ,对 其 行为 进行 深入 细致 的 
特征 描述 ,再 通过 数据 关联 ,可 以 与 敦煌 遗书 图 像 中 的 
相关 人 物 行 为 进行 比较 ,从 而 有 助 于 深化 对 唐 代 供养 
人 的 了 解 。 除 人 物 类 别 和 人 物 行为 外 ,人 物 画 还 包括 
人 物 的 头饰 服饰、 手势 、 足 部 的 方向 等 。 以 人 物 的 手 
势 为 例 ,P. 3905 记载 几 十 种 不 同 姿态 的 手印 图 ,各 图 
左 侧 还 有 相关 说 明文 字 , 这些 文字 对 于 进行 图 像 特征 
描述 可 谓 至 关 重 要 ,在 进行 元 数据 处 理 之 后 ,能 够 与 其 
他 类 别 如 敦煌 壁画 、 石 富 造 像 等 进行 数据 关联 ,从 而 有 
利于 研究 者 进行 横向 比较 ,拓展 其 研究 广度 和 深度 。 
4.5 情感 状态 

相 较 于 人 物 的 类 型 和 行为 活动 等 其 他 方面 ,情感 
状态 是 人 物 类 的 高 阶层 次 ,敦煌 遗书 中 的 人 物 图 像 并 


壁画 主题 词 表 中 使 用 “环境 "这 一 概念 ,将 环境 分 为 自 
然 环境 与 人 文 环境 ,但 敦煌 遗书 中 并 不 是 所 有 图 像 都 
有 场景 , 某 些 具有 场景 的 图 像 呈 现 的 环境 具有 艺术 想 
象 成 分 ,与 现实 环境 不 符 ,而 且 很 多 图 像 场景 根本 无 法 
得 到 辨识 。 但 如 果 技 术 条 件 允 许 还 应 尽力 进行 语义 标 
注 。 因 此 ,在 这 部 分 中 ,笔者 只 集中 讨论 可 以 识别 场景 
的 经 变 画 和 故事 画 。 敦 煌 遗书 图 像 中 出 现 大 量 故 事 场 
景 ,往往 是 佛经 故事 的 图 像 再 现 , 类 似 于 后 世 的 连环 
画 , 如 P.2003《 佛 说 阎罗 王 授 记 四 众 预 修 生 七 往生 净 
土 经 》, 类 似 图 像 的 刻印 本 或 其 他 写本 ,往往 被 称 为 佛 
经 变相 、 经 变 或 是 变相 。 由 于 后 世 刻 印 或 手 抄本 年 代 
远 远 晚 于 敦煌 遗书 ,所 以 敦 焊 遗书 图 像 对 研究 经 变 的 


非 千 篇 一 律 的 采 板 面孔 ,相反 大 量 图 像 反 映 出 相关 人 
物 的 各 种 情绪 ,或 是 恼 到 ,或 是 悲伤 ,或 是 欣喜 若 狂 ,或 
是 闷闷不乐 ,如 果 在 语义 描述 中 能 对 此 进行 细 化 , 那 将 
会 大 大 提升 检索 质量 和 关联 数据 的 实效 性 ,特别 是 有 
一 些 十 分 古怪 ,其 至 是 诡异 的 人 物 图 像 , 更 需要 补充 相 
关 描 述 语言 , 见 图 4 的 P.4514《 头 像 》, 图像 中 心 描绘 
一 位 妇女 的 正面 面容 ,夹杂 忧郁 、 大 恶 等 情绪 ,而 环绕 
着 头像 四 周 的 密密麻麻 的 眼睛 ,仿佛 是 画家 故意 营造 
出 一 种 特殊 、 神 秘 又 让 人 恺 惧 的 氛围 ,类 似 于 这 类 表达 
人 物 特殊 情绪 的 敦 焊 遗书 图 像 ,具有 独特 的 研究 价值 ， 
理应 给 予 更 多 关注 并 进行 细致 的 语义 描述 ,以 便 相 关 
学 者 展开 研究 工作 。 敦 煜 遗书 图 像 中 的 人 物 比 较 复 


127 


团 定 情报 三 作 


第 65 卷 第 7 期 2021 年 4 月 


ChinaXiv 合 作 期 刊 


杂 , 应 为 敦煌 遗书 图 像 中 的 人 物 单独 构建 本 体 ,在 语义 
描述 层级 中 ,对 比 人 物 的 行为 活动 ,服饰 .手势 等 低层 
级 特征 ,人 物 的 情感 态度 的 语义 描述 要 更 加 深入 ,但 
是 ,为 便于 抽取 实体 概念 和 深入 研究 ,可 将 人 物 的 情感 
态度 与 人 物 其 他 相关 方面 结合 共同 形成 敦煌 遗书 图 像 
中 的 人 物 本 体 模 型 , 见 图 5。 
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图 5 敦煌 遗书 图 像 中 人 物 本 体 模 型 


5 ”敦煌 遗书 图 像 知识 关联 的 组 织 框架 及 
其 实践 价值 


5.1 敦煌 遗书 图 像 知识 关联 的 组 织 框架 

关联 数据 能 够 将 复杂 异 质 资源 链接 起 来 ,准确 标 
识 和 定位 各 元 素 ,而 关联 数据 的 基础 RDF 定义 数据 元 
素 , 将 各 元 素 关 联 在 一 起 并 提供 通用 框架 合并 不 同 来 
源 的 数据 。 结 合 敦 烛 遗 书 图 像 语义 特征 层级 描述 模型 
与 关联 数据 技术 的 运用 ,敦煌 遗书 图 像 知识 关联 的 组 
织 框 架 自 下 而 上 应 包括 收集 数据 、 抽 取 语 义 信息 建构 
本 体 、 进 行 RDF 链接 、 为 用 户 提供 深度 服务 等 完整 步 
又 。 敦 焊 遗 书 图 像 知识 关联 的 组 织 框架 见 图 6。 

(1) 数 据 收集 层 。 收 集 数 据 是 敦煌 遗书 图 像 知识 


知识 挖 所 浏览 与 对 比 


十 


敦煌 读书 图 像 
语义 本 体 模 型 


没 流 和 索 诺 涪 


相关 数据 库 馆藏 数字 化 图 像 El 


图 6 敦煌 遗书 图 像 知识 关联 的 组 织 框架 


关联 的 语义 组 织 框架 构建 的 基础 工作 ,数据 的 来 源 多 
样 、 内 容 异 构 , 如 各 国 敦 煌 遗书 收藏 机 构 中 的 数字 化 图 
像 中 外 与 敦煌 遗书 相关 的 数据 库 、 专 业 数 据 库 中 收录 
的 研究 文献 (包括 学 术 期 刊 \ 论 车、 科普 性 书籍 等 等 ) 、 
与 敦 烛 遗书 图 像 有 关 的 电视 节目 、 纪 录 片 等 视频 资源 。 
国际 敦煌 项 目 (IDP) 正 在 建设 该 工作 ,但 仍 不 完善 ,可 
以 考虑 与 之 合作 ,在 建设 过 程 中 逐步 完成 图 像 数 据 关 
联 的 相关 准备 工作 。 对 于 非 数 字 化 的 资源 ,可 按照 国 
家 档案 局 发 布 的 4 纸 质 档案 数字 化 规范 兴 录 音 录像 数 
字 化 规范 ?等 档案 数字 化 领域 的 相关 标准 统一 转化 为 
数字 形式 。 这 些 数 据 、 信 息 和 知识 被 收集 后 会 出 现 重 
复 的 内 容 , 所 以 需要 对 它们 进行 基本 的 分 类 与 去 重 , 建 
立 初始 的 元 数据 语料库 。 在 第 一 层 数 据 采集 层 中 ,如 
果 不 对 复杂 的 数据 去 重 , 就 会 产生 噪音 数据 和 宛 余 信 
息 ,影响 后 续 数 据 的 语义 描述 质量 。 

(2) 语 义 描 述 层 。 语 义 描 述 层 顾名思义 是 指 对 图 
像 内 容 的 特征 进行 语义 描述 ,这 不 同 于 基于 文本 检索 
的 图 像 元 数据 (TBIR) 和 基于 内 容 检索 的 图 像 元 数据 
(CCBIR) 。TBIR 是 指 通过 人 工 对 每 一 张 图 像 用 关键 词 
进行 描述 ,从 而 形成 关键 词 索引 ,用户 可 通过 检索 关键 
词 搜索 所 需 图 像 ,虽然 TBIR 操作 容易 ,但 是 依旧 存在 
很 大 的 局 限 性 ,如 图 像 数量 的 庞大 与 人 工 标注 成 本 存 
在 矛盾 ,标注 者 与 用 户 在 自身 认 知 水 平 ,用 词 表 达 和 主 
观感 受 等 方面 存在 不 一 致 ,这 些 都 会 影响 图 像 的 检索 
质量 ”。CBIR 的 出 现 促使 计算 机 代替 手工 标注 , 它 
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可 以 利用 计算 机 直接 抽取 图 像 的 特征 ,从 海量 的 图 像 
中 快速 查找 到 与 用 户 需求 相 满足 的 相关 或 相似 的 图 
像 ,但 CBIR 同样 存在 不 足 之 处 即 只 能 对 图 像 的 底层 视 
觉 特征 如 图 像 的 色彩 .形状 和 纹理 等 进行 描述 ,无 法 实 
现 图 像 内 容 即 图 像 中 所 反映 的 人 物 、 时 间 、 地 点 ,事件 
等 方面 的 深层 语义 描述 。 本 体 是 指 共享 概念 模型 的 明 
确 的 形式 化 的 规范 说 明 5 , 简 而 言 之 ,本 体 是 某 个 领 
域内 实体 概念 的 集合 ,是 用 来 表示 语义 的 载体 ,本 体能 
对 实体 进行 分 类 ,确定 上 下 位 关系 及 所 有 实体 的 属性 ， 
还 能 实现 实体 之 间 跨 类 别 的 连接 。 因 此 , 相 比 于 TBIR 
和 CBIR ,构建 敦煌 遗书 图 像 知识 的 本 体能 够 实现 图 像 
本 身 的 高 级 语义 表达 ,使 用 户 的 检索 更 加 快捷 和 智能 。 
鉴于 此 ,笔者 自 建 本 体 模型 ,将 敦煌 遗书 中 的 图 像 分 为 
四 类 , 即 图 案 类 ,物体 类 ,场景 类 和 人 物 类 ,在 各 大 类 下 
又 仁 小 类 等 ,笔者 在 上 文 语义 数据 措 述 中 已 详细 阐述 ， 
这 旺 不 再 袭 述 。 然 后 对 本 体 进行 实体 抽取 、 关 系 抽取 
利 导 性 抽取 ,采用 RDF 格式 对 实体 及 实体 之 间 的 关系 
进 生 描述 ,形成 计算 机 可 以 理解 的 形式 。 再 通过 相关 
研 塞 文献 内 容 的 资源 自动 标 引 技 术 ,不 断 丰 富 敦 煌 吐 
后 加 像 的 语义 信息 ,建立 有 效 的 HTTP URI 进而 实现 
图 像 与 文本 的 语义 互联 ,为 多 种 类 型 的 数据 关联 做 好 
准 侈 。 

(3) 数据 关联 层 。 数 据 关联 层 是 实现 基于 关联 数 
据 侈 敦煌 遗书 图 像 知 识 关联 的 语义 组 织 模式 的 核心 。 
冰 锯 关联 包括 图 像 内 部 和 各 个 图 像 之 间 的 关联 ,以 敦 
煌 洲 书 中 P.4518(39) 的 《 达 摩 多 罗 像 为 例 ,图 中 达 麻 
[ 具 是 “ 持 有 "的 关系 ,与 此 同时 达 摩 罗 


图 像 的 原型 都 是 唐 代 李 通 玄 居 士 像 。 敦 烛 遗 书 图 像 知 
识 比较 分 散 且 杂乱 无 章 , 更 需要 对 语义 描述 层 形成 的 
RDF 形式 的 语义 元 数据 进行 分 析 , 根 据 图 像 自身 特点 
以 及 图 像 之 间 的 关系 将 这 些 散乱 的 元 数据 进行 重新 的 
整合 与 组 合 , 尽 可 能 将 敦煌 遗书 图 像 背后 隐藏 的 各 种 
关系 完全 展现 出 来 。RDF 三 元 组 语句 的 主 谓 宾 都 表现 


为 URI, 通 过 URI 对 相关 敦煌 遗书 图 像 的 数据 进行 统 
一 标识 ,然后 利用 RDF 将 不 同 的 数据 集中 链接 到 同一 
资源 的 元 数据 进行 关联 ,由 此 形成 语义 互联 网 络 。 数 
据 关联 层 基于 关联 数据 发 布 的 技术 将 RDF 语义 元 数 
据 相互 关联 ,以 此 揭示 隐 舍 在 不 同 遗 书 图 像 之 间 的 相 
互 关系 ,并 通过 RDF 链接 使 得 图 像 之 间 能 够 相互 访 
问 。 最 终 使 复杂 的 敦煌 遗书 图 像 资 源 信息 重组 为 一 个 
互相 联系 的 有 机 整体 ,发 掘 整个 敦煌 遗书 图 像 知识 网 
络 的 最 大 价值 ,提高 图 像 的 利用 质量 和 服务 效率 。 


《4) 知识 应 用 层 。 利 用 关联 数据 对 敦 焊 遗书 图 像 
采集 .描述 组织 和 整合 之 后 ,最 终 目的 是 为 用 户 提供 
图 像 知识 利用 服务 ,包括 将 图 像 知识 发 布 为 关联 数据 、 
图 像 语义 浏览 与 检索 .图 像 档案 知识 发 现 与 知识 挖掘 
等 ,从 而 形成 完整 的 敦煌 遗书 图 像 档案 的 组 织 模式 。 

敦煌 遗书 知识 关联 的 语义 组 织 模式 包括 数据 收集 
层 .语义 描述 层 数据 关联 层 和 知识 应 用 层 , 从 收集 基 
础 数据 的 前 提 工 作 ,到 对 敦煌 遗书 图 像 进行 语义 描述 ， 
再 到 建立 图 像 内 部 和 图 像 之 间 的 语义 关联 ,最 后 实现 
为 社会 提供 利用 的 终极 目的 。 任 何事 物 都 包括 形式 和 
内 容 , 在 第 二 层 语义 描述 层 中 ,笔者 提出 构建 敦煌 遗书 
图 像 本 体 描 述 图 像 内 容 的 特征 以 此 实现 图 像 的 高 级 语 
义 检索 ,这 是 数字 化 扫描 之 后 图 像 知 识 的 内 容 特征 ,与 
此 同时 笔者 也 提 到 基于 CBIR 技术 的 底层 视觉 特征 抽 
取 , 这 是 数字 图 像 的 形式 特征 。 但 是 在 进行 数字 化 扫 
描 前 ,敦煌 遗书 图 像 也 有 本 身 的 物理 特征 如 载体 材质 
和 载体 尺寸 等 等 ,这 三 方面 都 属于 图 像 的 特征 。 因 此 
在 设计 图 像 检 索 的 元 数据 时 应 该 包括 以 上 三 方面 ,这 
样 才能 把 敦 烛 遗书 图 像 的 特征 完整 地 表现 出 来 。 

5.2 敦煌 遗书 图 像 知识 关联 的 实践 价值 
5.2.1 打通 与 外 部 开放 数据 平台 的 知识 关联 

关联 数据 技术 不 仅 能 实现 图 像 之 间 的 语义 互联 ， 
还 能 与 网 络 开放 数据 平台 进行 语义 链接 ,推进 知识 关 
联 的 深度 与 广度 。 如 上 海 图 书馆 在 互联 网 上 公开 发 布 
的 “地 理 名 词 表 “中 国 历史 纪年 表 ”“ 收 藏 机 构 名 录 ” 
等 开放 数据 平台 以 及 王晓光 等 人 构建 的 敦煌 壁画 作词 
表 关联 数据 集 , 将 从 敦煌 遗书 图 像 中 抽取 的 实体 与 相 
关 的 外 部 开放 数据 集 进行 数据 匹配 与 关联 可 以 促进 敦 
焊 遗 书 图 像 领 域 知识 聚合 与 推理 。 敦 烛 遗 书 图 像 知识 
组 织 框架 的 数据 关联 层 可 与 "中国 历史 纪年 表 ” 收藏 
机 构 名 录 " 关联 获取 敦 焊 遗书 图 像 所 处 的 对 应 朝代 与 
地 点 , 敦 焊 壁 画 与 敦煌 遗书 图 像 密 不 可 分 ,与 “ 敦 焊 壁 
画 叙 词 表 关联 数据 集 ” 关 联 可 以 发 现 与 敦煌 遗书 图 像 
中 绘画 主题 绘画 技法 、 绘 画 人 物 \ 情 感 态度 相同 或 相 
似 的 图 像 , 既 能 获取 敦煌 遗书 图 像 与 敦 烛 壁画 之 间 隐 
藏 的 关系 ,又 能 比较 分 析 挖 据 出 敦 烛 遗书 图 像 中 未 知 
图 像 的 内 涵 。 此 外 ,数据 关联 层 还 应 与 敦 焊 遗 书 图 像 
相关 的 研究 文献 .视频 资源 等 进行 关联 ,在 对 敦煌 遗书 
图 像 进行 检索 时 还 能 展示 与 其 有 关 的 所 有 研究 资料 便 
于 科研 人 员 与 普通 用 户 了 解 该 图 像 的 研究 现状 。 
5.2.2 提高 敦煌 遗书 图 像 资源 的 检索 利用 

实践 上 ,对 图 像 中 丰富 的 内 容 元 素 进 行 细致 探究 ， 
将 语义 检索 、 关 联 数据 应 用 于 敦煌 遗书 图 像 研究 ,改变 
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了 传统 的 知识 结构 ,人 物 的 底座 .头饰 .动作 ,配色 等 细 
节 元 素 也 值得 与 其 他 佛像 图 进行 联系 对 比分 析 , 这 妈 
有 利于 敦煌 址 书 图 像 价值 的 知识 挖掘 深度 ,又 便于 专 
家 进行 专题 研究 ;大 数据 背景 下 ,应 努力 开发 计算 机 自 
我 学 习 功 能 ,以 期 将 各 类 图 像 的 语义 描述 打通 ,结合 
户 检索 需求 ,不 断 优化 语义 检索 模式 ,如 可 以 在 敦煌 中 
书 图 像 语义 检索 系统 中 设置 图 像 式 检索 功能 , 即 用 户 
在 看 到 敦煌 和 遗书 图 像 或 是 敦煌 壁 画图 像 时 ,可 直接 将 
所 拍 图 像 导入 检索 平台 ,经 过 AI 后 台 计 算 ,将 与 之 相 
匹配 .或 者 相 类 似 的 敦煌 遗书 图 像 悉数 呈现 出 来 。 
5.2.3 ”提高 敦煌 遗书 图 像 知识 服务 的 深度 和 广度 
据 当 代 学 者 研究 ,知识 服务 主要 是 指 按照 服务 对 
象 的 要 求 ,从 各 类 数据 信息 和 知识 资源 中 茶 取 特定 的 
信息 和 知识 内 容 ,并 据 此 构筑 数据 网 络 , 从 而 有 针对 性 
的 次 解决 特定 问题 提供 帮助 5 。 如 以 上 5. 2. 2 所 述 ， 
用 科 的 检索 需求 不 仅仅 局 限于 图 像 的 一 般 元 数据 字 
8 追求 图 像 的 细节 元 素 以 及 与 敦煌 遗书 图 像 相关 
g 现 史 背景 .视频 解答 和 研究 文献 等 其 他 类 型 信息 。 
由 331 可 知 目前 教 煌 遗书 图 像 相关 数据 库 在 数据 关联 
项 本 还 存在 不 足 之 处 ,无 法 满足 用 户 的 深层 次 需求 ,而 
次 当 联 数据 应 用 于 敦煌 和 划 书 图 像 知识 关联 的 组 织 结构 
dE 改 进 了 传统 知识 组 织 方式 ,促进 教 煌 遗书 图 像 检 索 
质 测 的 提高 ,不 仅 使 用 户 能 够 快速 检索 到 目标 资源 ,还 
能 发 现 与 敦煌 遗书 图 像 相关 的 历史 背景 语义 内 涵 、 研 
多 和 料 等 多 类 型 资源 ,提供 更 具 深度 和 广度 的 知识 服 


敦 烛 遗书 图 像 是 世界 的 艺术 宝藏 和 珍贵 的 文化 遗 
产 ,其 中 列 仿 丰富 复杂 的 历史 文化 和 艺术 等 元 素 。 本 
文 梳理 敦煌 遗书 图 像 的 语义 特征 并 进行 语义 分 析 , 根 
据 敦 煌 遗书 图 像 的 绘画 特点 ,借鉴 前 人 关于 敦煌 壁画 
的 语义 描述 思路 ,从 敦煌 遗书 原始 图 像 的 物理 特征 、 数 
字 图 像 自 身 的 颜色 、 形 状 的 底层 内 容 特 征 再 到 数字 图 
像 内 容 的 高 级 语义 特征 这 三 方面 展开 讨论 ,由 此 设计 
敦 烛 遗书 图 像 的 语义 特征 层级 模型 人 物 本 体 模型 , 提 
出 敦煌 遗书 图 像 知 识 关 联 组 织 框架 及 其 应 用 价值 , 包 
含 数 据 收集 层 ,语义 描述 层 ,数据 关联 层 和 资源 应 用 层 
四 层 框 架 及 其 实践 价值 。 

本 文 存在 许多 不 足 之 处 :首先 ,敦煌 遗书 中 的 图 像 
除 保存 部 分 完整 的 图 像 之 外 ,还 有 许多 残缺 的 图 像 ,为 
便于 研究 ,笔者 只 选择 敦煌 遗书 中 保存 较为 完整 的 图 
像 作为 研究 对 象 ,如 车 条 件 允许 ,关于 残缺 图 像 的 研究 


也 应 列 入 文中 进行 探讨 ;其 次 ,由 于 实践 条 件 和 技术 能 
力 限 制 , 本 文 只 是 提出 敦 烛 遗书 知识 关联 的 语义 组 织 


模式 和 语义 特 生 


E 层 级 模型 , 尚 需 在 具体 实践 的 过 程 中 


来 检验 相关 设想 的 可 行 性 ,并 做 出 相应 修正 和 完善 。 
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Knowledge Association and Semantic Description of Dunhuang Documents Images 
Cheng Jiejing Wang Xinyu 
School of Social Development, Yangzhou University, Yangzhou 225009 

Abstract: | Purpose/significance | The rapid development and wide application of information technology cer- 
tainly promote the reform of Dunhuang studies, which make the utilization of Dunhuang studies and its knowledge re- 
OUrces more convenient. Because of the traditional knowledge platform and retrieval method of databases, the value 
CSyring of knowlegde of Dunhuang documents images is not complete. Therefore, this paper combs the research of 
所 inhuang documents images and gives a full semantic description for the depth and breadth of their knowledge ，ex- 
ring the multiple values of Dunhuang documents images. | Method/process | Through the consideration and se- 
Giantic description of present researches of Dunhuang documents images, hierarchical model of semantic features was 
cabsigned in light of their semantic features. The organizational model was constructed by combing intelligent + and 
ed data. And this paper deeply analyzes knowledge association of the Dunhuang documents images and the data 
Eeallection layer, the semantic description layer, the data association layer and the resource application layer of the hi- 
lea voile | Result/ conclusion | The paper puts forward the practical value of the knowledge association mod- 
elsof Dunhuang documents, which can open the connection channel with outside data, improve the retrieval intelli- 

agentized quality of Dunhuang documents images , and enhance its depth and breadth of the knowledge service. 


Keywords: linked data Dunhuang documents images hierarchical model of semantic feature 


《图 书 情报 工作 》 杂 志 社 发 布 出 版 伦理 声明 


为 加 强 和 增进 学 术 论 文 写作 \ 评 审 和 编辑 过 程 中 的 学 术 规 范 、 科 研 诚信 与 学 术 道德 建设 ,树立 良好 学 风 , 维扬 
科学 精神 ,坚决 抵制 学 术 不 端 ,建立 和 维护 公平 公正、 公开 的 学 术 交 流 生态 环境 ,《 图 书 情报 工作 》 杂 志 社 (包括 《图 
书 情报 工作 《知识 管理 论坛 > 两 个 期 刊 编辑 部 ) 结 合 两 刊 实际 ,特制 订 出 版 伦理 声明 并 于 2020 年 2 月 正式 发 布 。 


: 该 出 版 伦理 声明 承诺 两 刊 将 严格 遵守 并 执行 国家 有 关 学 术 道德 和 编辑 出 版 相关 政策 与 法 规 ,规范 作者 、 同 行 
: 评议 专家 、 期 刊 编辑 等 在 编辑 出 版 全 流程 中 的 行为 ,并 接受 学 术 界 和 全 社会 的 监督 。 共 包括 三 大 部 分 ,总 计 十 五 
条 ,分 别 为 :一 \ 作 者 的 出 版 伦理 (学 术 论 文 是 科学 研究 的 重要 组 成 部 分 ;@) 学 术 不 端 是 学 术 论文 的 毒瘤 ;@ 作 者 
是 学 术 论文 的 主要 贡献 者 ;中 作者 署名 体现 作者 的 知识 产权 与 学 术 贡 献 ; 台 学 术 论 文 要 高 度 重 视 知识 产权 与 信息 
和 


Re 


安全 ;(@ 参 考 文献 的 规范 性 引用 是 学 术 规 范 的 重要 表征 ;@ 要 高 度 重视 研究 数据 与 管理 的 规范 性 ;@ 建 立 纠 错 与 学 
术 自 我 净化 机 制 ) 。 二 、 同 行 评议 专家 的 出 版 伦理 (@@ 同 行 评 议 是 论文 质量 的 重要 控制 机 制 ;四 评审 专家 应 遵守 论 
文 评审 的 相关 要 求 ; 四 评审 专家 要 严格 遵循 相关 的 伦理 指南 和 行为 准则 )。 三 编辑 的 出 版 伦理 (@@ 编 辑 应 成 为 学 
术 论 文 质量 的 守护 者 ;加 编辑 应 在 学 术 道德 建设 中 发 挥 监 控 作 用 ; 罗 编 辑 要 成 为 遏制 学 术 不 端的 最 后 屏障 ;名 对 学 
术 不 端 实行 “ 零 容 护 ”) 。 

全 文 请 见 :http://www. lis. ac. cn/CN/column/ column291. shtml 


2 


(本 刊 讯 ) 


全 全 一 一 一 一人 一 一 一 人 一人 一 全 一 人 下 一 全 全 人 一人 全 全 一人 全 人 全 全 人 全 人 人 人 一人 一人 全 人 全 全 人 人 一 全 一 一 一人 下 全 一人 一人 一人 一 人 一 人 一人 一人 一 全 一人 全 一 一 一 一 人 一人 一 一 一 一 一 


131 


